Contexto

Los datos diabetes-data.csv contienen la información de medición de glucosa en la sangre de 70 pacientes con diabetes observados en diferentes momentos del tiempo (horas, días, semanas, meses).

El contenido y formato de los datos es el siguiente:

  1. Fecha (date) en formato MM-DD-YYYY
  2. Hora (time) en formato XX:YY
  3. Código (code)
  4. Nivel de glucosa (value)
  5. Indicadora de paciente (individual)

Los datos de concentración en la sangre se obtienen de dos fuentes:

Las mediciones eletrónicas automáticas se obtienen con etiquetas de tiempo específicas, mientras que las mediciones obtenidas de los registros escritos corresponden a horarios ficticios con la siguiente relación: Desayuno (08:00), comida (12:00), cena (18:00), y hora de dormir (22:00).

El campo code corresponde al tipo de insulina administrada al paciente.

Nota: La información de la adminitración de insulina, en este momento, es irrelevante.

Un primer vistazo a los datos

     date               time               code          value       
 Length:29264       Length:29264      Min.   : 4.0   Min.   :  0.00  
 Class :character   Class1:hms        1st Qu.:33.0   1st Qu.:  6.00  
 Mode  :character   Class2:difftime   Median :48.0   Median : 24.00  
                    Mode  :numeric    Mean   :46.5   Mean   : 79.42  
                                      3rd Qu.:60.0   3rd Qu.:142.00  
                                      Max.   :72.0   Max.   :501.00  
                                                     NA's   :8       
   individual      atributo        
 Min.   : 1.00   Length:29264      
 1st Qu.:21.00   Class :character  
 Median :34.00   Mode  :character  
 Mean   :36.45                     
 3rd Qu.:55.00                     
 Max.   :70.00                     
                                   
Observations: 29,264
Variables: 6
$ date       <chr> "04-21-1991", "04-21-1991", "04-21-1991", "04-21-19...
$ time       <time> 09:09:00, 09:09:00, 09:09:00, 17:08:00, 17:08:00, ...
$ code       <int> 58, 33, 34, 62, 33, 48, 58, 33, 34, 33, 62, 33, 58,...
$ value      <dbl> 100, 9, 13, 119, 7, 123, 216, 10, 13, 2, 211, 7, 25...
$ individual <int> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ...
$ atributo   <chr> "medición de glucosa en sangre antes del desayuno",...

1. ¿Existe discrepancia (en media o distribucional) entre las mediciones reportadas de registros escritos en papel y las que son reportadas electrónicamene?

2. ¿ Existe discrepancia entre las mediciones de glucosa de los pacientes entre las cuatro horas del día donde se miden?

3. ¿ Existe discrepancia de las mediciones de glucosa entre pacientes?

4. ¿ Existe discrepancia entre las mediciones de glucosa asociadas con la administración de insulina con respecto a las demás?

Sí, son más bajas:

5. ¿Existe una discrepancia clara entre los pacientes que reportan sus niveles de glocosa depués de haber ingerido más alimentos de lo usual?

Modelo diferencia consumo de alimentos

Para esta pregunta se realizó un modelo jeráquico, la jerarquía se aplica a nivel individuo en donde los individuos comparten la precisión. Esto nos permite mejorar la precisión de las estimaciones de los parámetros para los que no se tienen suficientes observaciones. Por ejemplo, en este caso tenemos individuos con menos días observados.

En este primer modelo no se busca predecir el nivel de glucosa sino verificar si existe una diferencia clara entre los días que se ingieren más alimentos de lo usual.

Se crea una base con el promedio diario de glucosa con un indicador que especifica si en ese día el paciente ingirió más alimentos de lo normal.

Compiling model graph
   Resolving undeclared variables
   Allocating nodes
Graph information:
   Observed stochastic nodes: 3853
   Unobserved stochastic nodes: 7779
   Total graph size: 23408

Initializing model
  • Simulaciones de los parámetros

En esta gráfica se observa que hay una discrepancia clara entre los días que ingieren más alimentos de lo usal. \(Beta1\) es negativa y representa a los días que se consumió una cantidad normal de alimentos y \(Beta2\) es positiva lo cual significa que el nivel de glucosa aumenta si se come más de lo normal.

Se grafica el parámetro \(alpha\) para observar si existe alguna diferencia entre individuos. Observamos que se comportan de manera similar. (Los intervalos se empalman)

  • Resúmenes estadístico de los parámetros monitoreados
                   mean        2.5%       97.5%
beta.adj[1] -0.03343809 -0.04637457 -0.02077302
beta.adj[2]  0.03343809  0.02077302  0.04637457
  • DIC
[1] 41341.46
  • R2
[1] 0.2599973
  • Devianza
[1] 38795.73

Modelo nivel de glucosa

Queremos predecir la medición promedio de glucosa para un individuo cuando come una cantidad de alimentos normal o cuando se excede.

Para plantear este modelo, construimos una base con el promedio de las mediciones por individuo, separando por el tipo de consumo.

En exploratorio de los datos vimos que la mediana del nivel de gluscosa es mayor cuando se excede de la cantidad de alimentos habitual.

Compiling model graph
   Resolving undeclared variables
   Allocating nodes
Graph information:
   Observed stochastic nodes: 104
   Unobserved stochastic nodes: 281
   Total graph size: 914

Initializing model
  • Gráfica observado vs ajustado

En la gráfica de ajustados vs osbservados se aprecia que los puntos están alrededor de una linea de 45º. Podemos ver que sobreestimamos mediciones pequeñas y subestimas mediciones grandes.

  • Intervalos de confianza

Los datos observados se encuentran dentro de nuestros intervalos de confianza.

  • Simulaciones de los parámetros

Observamos que las betas indican una discrepancia entre la diferencia de la ingesta de alimentos, pero no es tan discrminante como el modelo anterior. Esto se puede deber a que estamos promediando individuos y no individuos-días.

Se grafica el parámetro \(alpha\) para observar si existe alguna diferencia entre individuos. Observamos que se comportan de forma similar. Sin embargo, en este caso hay alphas cuyos intervalos no se interceptan, entonces estos individuos sí tienen comportamiento distinto en sus mediciones de glucosa.

En este modelo se obtiene un mejor DIC y \(R^2\).

  • Resúmenes estadístico de los parámetros monitoreados
                   mean        2.5%       97.5%
beta.adj[1] -0.04094879 -0.07072841 -0.01101044
beta.adj[2]  0.04094879  0.01101044  0.07072841
  • DIC
[1] 1013.093
  • R2
Error in cor(base_ingesta$medicion, out.yf[, 1]): 'x' must be numeric
[1] 0.2599973
  • Devianza
[1] 913.7663